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摘要 : 科研 人 员 在 钻研 科研 问题 与 分 享 科 研 数据 的 过 程 中 , 需要 某 种 基础 设施 来 确保 数据 最 大 程度 的 获取 性 、 
稳定 性 和 可 用 性 。 这 类 基础 设施 可 以 统称 为 科研 数据 知识 库 (Research Data Repository, RDR)。 自 2012 年 启动 
的 re3data.org 项 目 ， 主 要 从 事 科 研 数 据 知识 库 的 登记 注册 ,以 及 为 科研 人 员 、 科 研 资助 组 织 、 图 书馆 和 出 版 商 


等 提供 有 关 异 构 科 人 研 数据 知识 库 的 全 景 概述 。 截 至 2013 4E 7 H, 已 有 400 个 科研 数据 知识 库 向 re3data.org 登 
id, 其 中 288 个 采用 re3data.org 的 信息 图 标 ,以 协助 科研 人 员 六 选 合 适 的 知识 库 , 并 且 存 储 与 重用 他 们 的 数 
据 。 这 篇 论文 描绘 异 构 RDR 的 全 景 ,表述 机 构 的 、 学 科 的 、 跨 学 科 的 以 及 项 目 专业 的 RDR 类 型 。 深 入 描述 
re3data.org 的 特性 ,以 及 这 套 注册 系统 如 何 协助 科研 人 员 分 辨 适合 存储 和 搜索 科研 数据 的 知识 库 。 

关键 词 : 科研 数据 ”科研 数据 管理 ”开放 获取 ”机构 知 识 库 发 展 ”开放 科学 ”科研 数据 知识 库 ”信息 管理 
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Il 


科研 数据 共享 与 重用 及 其 发 展 ,， 近 年 来 逐渐 得 
到 重视 。 其 实 , 早 在 2003 年 世界 主要 科研 组 织 就 开 
始 呼吁 科学 与 人 文 知识 的 开放 获取 ， 而 且 在 其 《柏林 
宣言 》(Berlin Declaration, 2003) 中 ,也 将 科研 数据 作 
为 学 术 知 识 的 一 部 分 四。 在 2007 年 经 济 合作 发 展 组 
织 (OECD) 发 布 的 《公共 资金 科研 数据 获取 的 原则 与 
此 南 》 中 ， 提 出 “促进 科研 人 员 之 间 的 数据 访问 和 共 
享 ”作为 宗旨 外。 这 是 在 学 术 体 系 中 涉及 不 同 利益 相 
关 者 的 广泛 持续 辩论 中 ， 可 被 人 们 遵循 的 两 份 早期 
参考 文献 。 

英国 皇家 学 会 在 2012 年 发 布 《 科 学 是 开放 事业 》 
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的 报告 中 ,敦促 科学 家 们 在 “可 理解 的 开放 性 
(Intelligent Openness)” 的 层面 上 , 使 得 科研 人 员 的 科 
研 数据 可 获取 和 可 利用 :“ 科 学 家 们 应 该 在 合适 的 数 
据 知识 库 里 存储 数据 ,让 人 使 用 和 验证 数据 ”FI。 欧盟 
的 一 项 政策 回应 了 这 个 建议 : 欧盟 寻求 成 员 国 通过 
有 关 政 策 以 确保 “公共 资金 资助 科研 成 果 的 科研 数据 
通过 电子 基础 设施 实现 公共 获取 、 使 用 和 重用 ”中 。 
美国 政府 更 进一步 , 要 求 美国 国立 科研 机 构 的 数字 
科研 数据 实施 最 大 程度 的 获取 。 白宫 科技 政策 办 公 室 
(OSTP) 指 明 “ 无 论 全 部 或 者 部 分 受到 联邦 资助 的 科研 
项 目 ， 所 产生 的 数字 形式 的 科研 数据 都 应 该 存储 
起 来 ,并 且 提 供 搜 寻 、 检 索 和 使 用 等 的 公共 访问 获 
取 ” 一 。 欧 盟 计划 在 第 8 次 Horizon 2020 框架 中 加 入 


* 本 文 译 自 : Making Research Data Repositories Visible: The re3data.org Registry,PLOS ONE,2013,8(11):e78080.DOI: 10.1371/journal. 


pone.007808, 经 原作 者 授权 翻译 以 中 文 发 表 。 
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类 似 的 要 求 外 。 上 述 政策 的 具体 执行 ,有赖 于 在 不 同 
学 科 中 对 科研 数据 知识 库 进行 取舍 ， 而 这 就 要 求 科 
研 数据 术语 的 准确 定义 。 

根据 科研 方法 和 不 同学 科 中 的 科研 对 象 的 特征 ， 
人 们 对 科研 数据 会 有 不 同 的 认识 。 然而, 科研 数据 的 
概念 检验 ， 如 同 科研 数据 知识 库 一 样 重要 ,必须 服务 
不 同学 院 和 学 术 社 群 以 及 符合 它们 对 科研 数据 概念 
的 认识 。 信 息 基 础 设施 的 需求 同样 来 自 于 内 容 和 用 户 
需求 。 

所 以 , 我 们 定义 科研 数据 这 个 术语 , 即 下 : 作为 
科研 过 程 的 一 部 分 或 者 结果 的 数字 数据 。 

此 过 程 覆 盖 科 研 的 所 有 阶段 ， 从 科研 数据 生成 
到 科研 结果 产 出 , 包括 科学 、 社 会 科学 实证 研究 或 是 
文化 现象 观察 等 。 数 字 科研 数据 因为 学 科 和 方法 的 不 
同 ， 而 有 不 同 的 数据 类 型 、 不 同 程度 的 集成 方式 以 及 
数据 格式 。 就 科研 数据 使 用 与 重用 的 获取 目的 而 言 ， 
如 果 缺 乏 元 数据 以 及 描述 内 容 和 工具 来 具体 规范 如 
何 创造 、 存 储 、 调 整 和 分 析 数 据 档案 ,， 则 数字 科研 数 
ERA EZME”, 

数据 政策 要 求 接受 资助 的 科研 人 员 以 及 论文 作 
者 ， 确 保 出 版 或 者 在 项 目 中 产生 的 数据 具有 可 获取 
性 由 。 这 对 科学 家 们 以 及 科研 机 构 如 何 持 有 科研 数据 
FET, 而 且 对 资助 机 构 和 期 刊 的 相关 政策 建 
议和 强制 执行 方式 会 有 更 大 影响 。 举 例 来 说 , 美国 
家 科学 基金 会 (NSF) 的 《数据 开放 政策 》 要 求 项 目 申 
请 者 “在 不 增加 成 本 以 及 过 多 时 间 的 情况 下 , 将 原始 
数据 、 样 本 、 物 质 材料 和 其 他 在 NSF 资助 下 的 工作 
所 创造 或 者 产生 的 附加 材料 , 与 其 他 科研 人 员 共 
享 抑 ]。 在 《数据 管理 计划 》 中 NSP 更 进一步 要 求 测 
量 这 项 政策 规定 的 执行 情况 中 。 德 国 科研 基金 会 
(DFG) 自 2010 年 开始 的 项 目 方案 中 具有 类 似 的 科研 
数据 处 理 原则 , 据 此 , 德国 科研 人 员 应 该 尽 其 所 能 地 
符合 “现存 标准 和 数据 知识 库 ” 的 要 求 00。 类 似 条 件 也 
可 在 学 术 期 刊 出 版 商 的 “编辑 政策 ”中 发 现 , 例如 自 
然 出 版 集团 (NPG) 要 求 “作者 不 设 任 何 限制 地 提供 材 
料 、 数 据 和 有 关 协 议 给 其 他 人 ”中 。 因 此 , 科研 数据 
的 开放 共享 理应 通过 公共 知识 库 来 实现 。 

尽管 科学 家 们 认同 为 科学 进步 实施 数据 共享 ， 
有 其 共同 潜在 利益 ; 然而 多 数 人 在 实际 执行 的 时 候 
还 是 有 所 顾忌 中。 激励 措施 可 以 促进 变化 , 例如 数 
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据 的 适当 引用 等 站。 因此, 数据 共享 集成 在 学 术 交 流 
中 有 很 大 的 发 展 空间 。 

科研 数据 可 以 经 过 三 种 发 布 策略 实施 开放 获 
gg US. 

(1) 科研 数据 独立 发 表 : 作为 独立 的 信息 对 象 ， 
由 知识 库 发 布 1。 

(2) 科研 数据 与 文本 文献 一 同 发 表 : 此 类 情况 又 
称 数 据 论文 1。 

(3) 科研 数据 依附 出 版 物 发 表 ( 使 出 版 物 丰 富 化 ): 
作为 注释 文本 内 容 的 材料 ， 以 丰富 出 版 物 内 容 的 用 
i, VENA AT, 

这 些 发 布 策略 的 共同 特征 是 要 求 信息 基础 设施 
能 够 确保 数据 在 最 大 程度 上 进行 永久 保存 和 开放 共 
享 。 这 种 基础 设施 的 名 称 包 括 : 数据 档案 、 数 据 中 心 、 
数字 图 书馆 、 数 字典 藏 和 其 他 名 称 等 , 我们 称 它们 是 
科研 数据 知识 库 (RDR)。 

目前 为 止 , 人 们 缺乏 针对 上 述 基 础 设施 及 其 功 
能 的 全 面 概述 。 科 研 数据 知识 库 的 注册 机 制 re3data. 
org 改变 了 这 种 不 利 的 局 面 。 该 项 目 已 经 在 2012 EF 

台 对 科研 数据 知识 库 进 行 索引 ,并 且 提 供 科 研 人 员 、 
资助 机 构 、 图 书馆 和 出 版 商 一 份 系统 性 概述 异 构 
RDR 的 全 景观 测 。 在 2013 年 7 H , re3data.org 的 注册 
清单 上 已 有 400 个 科研 数据 知识 库 。 其 中 的 288 个 采 
用 一 份 由 re3data.org 开发 的 特殊 标识 符号 来 详细 描 
述 自己 。 以 下 给 出 一 个 RDR 的 全 景观 测 ( 见 第 2 节 ); 
此 外 ,本 文 描 述 了 注册 机 制 的 发 展 , 在 re3data. org 上 
的 功能 ， 以 及 解释 这 套 机 制 如何 帮 助人 们 确定 适合 
科研 数据 存储 与 搜索 的 知识 库 ( 见 第 3 节 )。 


2 科研 数据 知识 库 全 景 


欧盟 理事 会 2009 年 的 ICT 报 告 总 结 “整个 欧洲 的 
数据 知识 库 非 常 异 质 化 , 不 过 我 们 具有 连贯 的 发 展 
政策 ,作为 克服 这 种 零散 状态 的 坚实 基础 ， 并且 提供 
科研 社 群 得 以 更 好 地 管理 、 使 用 、 存 储 和 保存 数 
据 尖 0。 理 事 会 强调 目前 信息 基础 设施 的 全 景观 测 恰 
当 清 晰 地 表达 了 对 集成 和 同化 科研 数据 服务 的 需求 。 

RDR 及 其 服务 因为 所 存储 内 容 的 不 同 而 各 具 特 
点 , 它们 在 不 同情 况 下 , 为 各 式 各 样 文件 类 型 的 获取 
与 使 用 进行 存储 。 然 而 对 比 科 研 数据 的 存储 ， 人 们 更 
关注 知识 库 提供 科研 出 版 物 的 标准 规范 。 开 放 档 案 协 
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议 (OAD 很 早 就 建立 了 促进 机 构 或 者 学 科 知 识 库 的 标 
准 规范 和 网 络 ， 以 提供 文本 信息 对 象 的 开放 获取 ， 如 
科研 论文 (前 出 版 或 者 后 出 版 )、 学 位 论文 等 后 ]。 反 之 ， 
RDR 社 群 缺乏 可 以 比拟 的 标准 规范 。 
直至 今日 , 仅 有 少数 研究 调查 了 科研 数据 知识 
库 的 全 球 现 况 , 例如 2010 年 Marcial & Hemminger 
出 版 对 100 个 RDR 的 调查 研究 号。 而 在 2011 年 
Schaaf 有 类 似 研究 1, 纵 观 各 个 学 科 已 经 出 现 大 量 不 
同 的 RDR WH, 即便 只 看 单一 学 科 ,， 生物 医学 也 提 
供 了 为 数 可 观 的 RDR 数目 , 它们 塑造 了 今日 科研 数 
据 基 础 设施 的 全 景 。 不 仅 如 此 , 生物 医学 的 数字 基础 
设施 也 能 够 被 其 他 专业 学 术 社 群 获取 。 核酸 研究 期 刊 
在 2013 年 编辑 的 “分 子 生物 数据 库 ” (http:/www. 
oxfordjournals.org/nar/database/a/) 星 现 1512 个 生物 科 
研 数据 存储 的 基础 设施 中 ,其 中 的 200 个 基础 设施 通 
过 在 欧洲 生命 科学 基础 设施 的 范围 内 的 生物 信息 项 
目 (ELIXIR)。 有 来 自 100 个 研究 机 构 至 少 350 位 员工 
在 负责 这 200 个 知识 库 的 运行 。 数 以 千 计 的 科学 家 们 
组 成 的 社 群 , 使 用 了 这 类 RDR。 这 200 个 RDR 每 年 
直接 成 本 大 约 是 3 000 万 欧元 1, 为 了 生物 医学 RDR 
的 可 持续 运作 ，ELIXIR 加 入 欧洲 战略 论坛 科研 基础 
设施 (ESFRD， 有 策略 地 推动 和 维持 欧洲 科研 范围 
(European Research Area, ERA) 作 为 国际 科研 中 心 的 
地 位 。 从 2004 年 启动 时 ESFRI 就 很 清楚 科研 基础 设 
施 不 仅 只 有 物理 基础 设施 ， 如 科研 舰队 或 粒子 加 速 
ar, 而且 包括 数字 信息 基础 设施 ， 像 是 “科研 出 版 与 
数据 库 的 电子 档案 系统 ”等 01。 
2.1 ”科研 数据 知识 库 的 类 型 

以 下 是 在 分 析 400 个 RDR 的 基础 上 演化 而 来 的 
RDR 类 型 体系 。 基 于 机 构 和 学 科 的 学 术 文 献 知 识 库 
之 间 具 有 宽泛 的 差异 性 PC 本 文 作者 区 分 机 构 的 、 学 
科 的 、 跨 学 科 的 ,以 及 项 目的 RDRUS, WR BEB 4 
种 知识 库 之 间 的 类 型 差异 。 这 种 系统 性 梳理 有 助 于 全 
面 鸟 获 科 研 数据 基础 设施 在 永久 访问 和 重用 上 的 不 
同 概念 和 战略 。 

(1) 机 构 科 研 数据 知识 库 

机 构 科 研 数据 知识 库 由 大 学 或 者 研究 机 构 来 运 
行 。 在 大 学 层面 上 是 器 学 科 规 模 。 爱 丁 堡 DataShare 
(http://datashare.is.ed.ac.uk) 是 英国 的 一 个 机 构 RDR 
案例 。 爱 丁 堡 大 学 在 DSpace 软件 框架 的 基础 上 , 制 
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定 “ 跨 学 科 科 研 数据 的 网 络 数字 知识 库 抑 5 并且 在 
2007 年 到 2009 年 完成 开发 捕 。 截 至 2013 年 3 H, 知 
识 库存 储 共 61 个 数据 集 。 莫 尼 黑 大 学 开放 数据 
(http://data.ub.uni-muenchen.de) 是 男 外 一 个 来 自 德 
的 机 构 RDR 案例 。 自 2010 年 起 采用 ePrints 软件 并 
且 作为 莫 尼 黑 大 学 的 所 有 成 员 的 科研 数据 发 布 平 
BP, 该 知识 库 在 2013 年 3 月 存储 了 35 项 数据 集 。 

(2) 学 科 科 研 数据 知识 库 

在 学 科 RDR 里 比较 突出 的 案例 是 GenBank 和 
PANGAEA ~ GenBank ff HR 4 (http://www.ncbi.nlm. 
nih.gov/genbank) 始 于 1982 42°" ii Hei A dix 
FEP H hc ae A E EE S CT B. FP 909 P] ZS STE HE 
库 ”。 美国 国家 生物 技术 信息 中 心 (NCBD 运 行 这 套 基 
础 设施 ， 提 供 超过 25 万 种 的 核 苷 酸 序列 信息 已 1。 

作为 地 球 与 环境 科学 的 数据 发 布 者 (http:/ 
www.pangaea.de)， 盘 古 大 地 (PANGAEA) 的 定位 是 
“存档 、 发 布 、 传 播 从 地 球 系统 研究 得 到 的 地 理 参照 
数据 的 开放 获取 图 书馆 ”1。 这 个 RDR 是 由 Alfred 
Wegener 极地 与 海洋 研究 所 (AWD) 和 不 来 梅 大 学 海洋 
环境 科学 中 心 MARUM) 来 运行 。PANGAEA 开始 的 
时 候 是 “古代 气候 数据 中 心 ”， 它 在 1994 年 到 1997 年 
间 受 到 德国 联邦 教育 与 研究 部 (BMBF) 的 资助 中 。 在 
2011 年 PANGAEA 存储 “大 约 50 万 笔 的 地 球 科学 领 
Ji oic en Pd 

(3) 跨 学 科 科 研 数 据 知识 库 

除了 机 构 和 学 科 等 方式 , 科研 数据 知识 库 还 能 
服务 跨 学 科 需 求 。 作 为 科研 数据 知识 库 案例 之 一 的 
Figshare(http://figshare.com) 就 “允许 科研 人 员 采 取 引 
用 、 搜 索 和 共享 的 方式 发 布 他 们 所 有 的 数据 1。 从 
2011 年 开始 , Figshare 由 Macmillan 出 版 公司 的 数字 
科学 部 门 来 营运 B9。 第 二 个 案例 LabArchives (http:// 
www.labarchives.com) 是 “基于 网 络 的 电子 笔记 本 软 
fF", 它 由 一 家 私人 公司 经 营 , 允许 科学 家 们 “储存 、 
组 织 和 发 布 他 们 的 科研 数据 ”1。 

(4) 项 目 科研 数据 知识 库 

特别 的 科研 项 目 会 产生 特殊 的 科研 数据 ， 而 它 
们 导致 各 式 各 样 的 RDR 状态 。 由 GFZ 德国 地 球 科 
学 研究 中 心 运行 的 科学 钻探 数据 库 (SDDB)(http:// 
www.scientificdrilling.org) 可 被 称 为 典范 。 它 提 供 产 生 自 
科学 大 陆 钻探 计 划 GCDP) 的 钻探 数据 的 开放 重用 5。 


伯 尼 和 尔 数字 神殿 项 目 (http://www.digitalpantheon. 
ch/repository) 的 RDR 是 另 一 个 案例 ， 风 马 神 式 的 高 
解析 度 图 像 和 可 视 化 均 可 自由 访问 。 

上 述 4 种 类 型 呈现 了 异 构 RDR 的 整体 景观 。 它 被 
实际 运用 在 描述 那些 符合 潜在 用 户 需求 的 RDR 服务 。 
2.2 ”科研 数据 管理 服务 与 工具 的 需求 

从 科研 人 员 的 角度 来 看 ,目前 存在 各 种 各 样 影 
响 学 者 们 主动 分 享 科研 数据 的 障碍 。 目 前 Kuipers 和 
Van der Hoeven 的 全 面 研究 0 、Tenopir 等 上 以 及 
ODE 项 目 外 等 的 研究 表明 ,数据 共享 的 意愿 与 一 个 
文 持 科研 数据 的 基础 设施 密切 相关 。 骨 入 学 术 工 作 流 
程 的 知识 库 以 及 与 之 相关 的 激励 措施 ， 可 以 促进 数 
据 共享 。Tenopir 等 在 一 项 超过 1 300 名 科学 家 的 调查 
中 , 得 出 结论 :“ 几 乎 所 有 学 科 的 多 数 受 访 者 ……: 愿 
意 把 他 们 的 科研 数据 至 少 放置 一 部 分 在 一 个 没有 限 
制 的 中 央 数 据 知 识 库 内 ”。 然 而 障 但 之 一 是 学 者 们 缺 
乏 对 已 有 RDR 的 完整 认识 。 

为 此 , re3data.org 付 诸 行动 。 今 天 , 在 大 多 数学 科 
中 ,很 难得 知 现 有 ROR 的 完整 概况 。 尽 管 有 像 
OpenDOAR 开放 获取 知识 库 目 录 (http://www. 
opendoarorg) 和 ROAR 开放 获取 知识 库 注册 
(http://roar.eprints.org) ix FEN Lill, 也 只 包含 一 小 部 
分 的 科研 数据 知识 库 ( 小 于 5%) 的 信息 ， 因 为 这 两 个 
机 制 的 重点 是 学 术 出 版 物 的 知识 库 。 过 去 几 年 , 像 是 
OAD 开放 获取 目录 (http:/oad.simmons. edu/oadwiki/ 
Data repo sitories) 以 及 DataCite(http:// www.datacite. 
org/repolist) 等 网 站 开始 列举 RDR。 然 而 , 这 些 目录 以 
及 类 似 的 服务 只 提供 了 关于 RDR 和 它们 服务 的 基 
础 信息 , 像 是 简短 描述 那些 维护 中 的 知识 库 运行 、 
学 科 和 URL 等 。 为 了 克服 上 述 在 用 户 调查 号 ”中 
所 看 到 的 障碍 ， 有 必要 向 科研 人 员 、 资 助 机 构 、 图 书 
馆 以 及 出 版 商 等 提供 RDR 的 系统 性 和 易 用 性 综述 。 
这 意味 着 ， 如 果 注 册 机 制 想 要 传递 实 实在 在 的 信息 ， 
或 者 在 科研 数据 重用 的 条 件 下 实施 开放 共享 ， 就 有 
必要 比 现 有 的 目录 提供 更 为 详细 的 RDR 描述 。 科 研 
人 员 想 要 知道 怎么 存储 他 们 所 拥有 的 数据 ， 所 以 他 
们 必需 知道 RDR 特性 的 信息 , 像 是 : 这 个 RDR 上 线 
BAT? 它 受 到 什么 样 的 资助 ? 这 个 RDR 是 否 有 其 
政策 ? 谁 负责 这 个 RDR 的 运作 ? 这 些 都 是 让 科研 人 
员 得 以 信任 RDR 的 必要 信息 。 
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3 注册 科研 数据 知识 库 的 re3data.org 机 制 


科研 人 员 即 将 高 度 关注 RDR 的 存储 与 利用 。 然 
m, 开放 科学 的 技术 与 政策 需求 ,包括 公共 资助 
的 科研 数据 与 结果 的 开放 获取 等 ,如 果 缺 乏 可 信 、 持 
久 、 可 持续 的 基础 设施 来 支持 科研 人 员 共 享 他 们 科研 
数据 ， 则 注定 要 失败 。 对 RDR 运行 的 调查 显示 ,超过 
5 年 就 不 再 为 基础 设施 提供 财务 支持 的 安全 期 具有 不 
确定 性 局 ”1。 所 以 ， 当 前 的 科研 发 展 战略 和 长 期 资助 
计划 还 有 许多 需要 积极 填补 的 空 

欧盟 委员 会 在 2010 年 曾经 委托 的 一 项 人 研究 ， 描 
述 在 2030 年 的 科研 数据 处 理 愿 景 。 由 此 得 知 ,科研 
人 员 需 要 能 够 “发 现 、 获 取 和 处 理 他 们 所 需 的 数据 ”。 
此 外 ,科研 人 员 采 集 数 据 时 ,将 会 在 国际 标准 的 基础 
上 进行 “在 可 靠 的 知识 库 中 存储 他 们 可 信赖 的 数 
据 扣 3。 另 一 方面 ,实现 这 个 愿景 的 学 术 体 系 所 面临 
的 核心 挑战 是 : 因应 数据 共享 增长 的 背景 以 及 RDR 
的 异 构 性 。 有 鉴于 此 ,科研 数据 知识 库 协议 的 注册 机 
制 re3data.org(http://re3data.org) 针 对 RDR 目录 进行 
开发 与 运行 。 这 项 计划 则 在 对 所 有 领域 的 RDR 基于 
注册 机 制 进行 索引 化 和 结构 化 描述 。 用 信息 图 标 来 描 
述 每 个 RDR 的 基本 特征 ， 这样 就 能 创造 快速 和 容易 
使 用 系统 的 附加 价值 。 

德国 地 球 科学 研究 中 心 (GFZ) 的 图 书馆 与 信息 服 
务 部 门 (LIS)、 柏 林 洪 堡 大 学 的 图 书馆 与 信息 科学 学 
A, 以 及 卡尔 斯 鲁 厄 理工 学 院 (KIT) 图 书馆 是 
re3data.org 项 目的 核心 成 员 。 这 三 个 项 目 伙 伴 与 德国 
网 络 信息 协议 组 织 (DIND 具 有 长 期 回 定 合作 关系 。 在 
DINI 资助 下 的 科研 数据 政策 报告 于 2009 4E Re Ai"! 
德国 科研 基金 会 DFG) 资 助 了 自 2012 年 1 月 到 2013 
年 12 月 的 第 一 期 项 目 。 

该 项 目的 主要 目标 是 提供 数据 供应 者 和 数据 使 
用 者 双方 科研 人 员 对 RDR 异 构 全 景 的 指引 , 并 且 服 
务 科 研 资助 者 和 基础 设施 维护 者 ， 如 数据 中 心 和 学 
术 图 书馆 。 进 一 步 来 说 , re3data.org 旨 在 建立 更 为 集 
中 和 集成 的 “数据 知识 库 的 生态 系统 "1; 注册 机 制 
描绘 世界 范围 内 的 RDR 发 展 状 况 。 这 种 全 球 概览 
可 用 于 协助 那些 RDR 尚未 发 达 的 学 科 领 域 。 

起 先 re3data.org 列表 上 只 有 少数 RDR 以 及 基本 
信息 , 像 是 知识 库 名 称 、 维 护 者 和 学 科 专 业 等 。 在 
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2012 4F 12 月 项 目 收集 和 记录 了 将 近 400 个 存储 科研 
数据 的 基础 设施 。 目 前 的 开放 获取 目录 (OAD) 列 表 就 
采用 了 这 套 全 景观 测 结果 。 

re3data.org 项 目的 三 个 合作 伙伴 各 自 独立 检测 
随机 选取 20 次 的 RDR。 第 一 次 的 分 析 确 认 了 一 幅 极 
端 异 质 的 RDR 全 景 以 及 成 为 创作 RDR 描述 框架 草稿 
的 基础 。 因 为 缺乏 一 个 合适 框架 ， 所 以 促使 
re3data.org 发 展 一 个 新 的 描述 RDR 的 元 数据 框架 。 
在 第 二 阶段 , 这 个 架构 对 接 类 似 的 元 数据 框架 ,调整 
了 图 标 元 素 , 并 且 介 绍 RDR 的 基本 条 件 。 

第 一 版 描述 RDR 的 关键 术语 在 2012 年 7 月 的 一 
份 文件 中 发 表 中 。 对 图 标的 评论 取 自 电子 邮件 反馈 
以 及 项 目 网 站 , 在 确保 符号 体系 发 展 的 透明 性 的 基 
Wl E, 它 获得 了 RDR 社 群 的 参与 和 接纳 。 

各 项 反馈 十 分 正面 ,而 且 在 一 些 案例 中 有 非常 
续 密 的 阐述 。 项 目 得 到 来 自 reBIND (http://rebind. 


该 项 科研 数据 知识 库 通过 
re3data.org 小 组 的 审核 


该 项 科研 数据 知识 库 既 通 
过 认证 也 支持 知识 库 标 准 


该 项 科研 数据 知识 库 采 用 的 标识 符 
系统 能 够 让 它 所 提供 的 科研 数据 具 
有 永久 性 、 统 一 性 以 及 可 被 引 性 


图 1 


准 的 共同 匮乏 ， 认 证 条 件 与 RDR 审计 程序 受到 检 
验 5* ,其 中 若干 条 件 存 在 不 普遍 适用 RDR 的 情况 。 
所 以 , 需要 适当 降低 RDR 加 入 re3data.org 注册 的 门 
监 。 然 而 ,为 了 让 知识 库 在 re3data.org 能 被 索引 ， 科 
人 研 数 据 的 获取 和 许可 的 细节 和 缺 一 不 可 。 如 果 您 的 
RDR 满足 了 这 些 基本 要 求 ， 则 可 以 被 索引 和 被 评论 。 
图 标 集 凸显 了 知识 库 的 主要 特性 ， 如 图 2 所 示 。 
图 标 系 统 帮 助 用 户 去 选择 适合 存储 他 们 数据 的 


这 套 


现代 图 书 情报 技术 


bgbm.org) , DataCite(http:/www.datacite.org) 和 OpenAIR 
Eplus (http://www.openaire.eu) 以 及 其 他 反馈 。 项 目 小 
组 分 析 和 讨论 了 所 有 意见 并 且 建 议 纳 入 关键 术语 的 
考量 ,以 指导 修改 在 2012 年 12 月 所 公布 的 核心 要 素 
第 二 版 由。 这 些 图 标 要 素 ( 符 号 体系 ) 包 括 以 下 几 个 方 


面 ( 见 图 1): 
(1) 一 般 信息 (如 RDR 的 简短 描述 、 内 容 类 型 、 
关键 词汇 等 ); 


(2) 知识 库 群 (如 受 资助 的 机 构 责任 、 内 容 或 者 技 
术 议 题 等 ); 

(3) 政策 (如 RDR 政策 , 包括 它们 的 URL 等 ); 

(4) 法 律 议 题 (数据 库 以 及 数据 集 的 许可 证 等 ); 

(5) 技术 标准 (如 应 用 程序 界面 、 数 据 集 版 本 、 
RDR 软件 等 ); 

(6) 质量 标准 和 服务 (如 证 书 、 审 计 过 程 等 )。 

由 于 不 同学 术 社 群 的 异 构 性 需求 以 及 RDR 标 


该 项 科研 数据 知识 库 在 它 
的 服务 里 有 提供 说 明 信 息 


该 项 科研 数 


据 知 识 库 具 有 
具体 明确 的 政策 


9 
3 


TASHA AE HR TUA Fe pe Ot 
开放 的 /限制 的 /封闭 的 数据 


该 项 科研 数据 知识 库 提供 
使 用 条 款 和 数据 许可 


科研 数据 知识 库 的 关键 要 素 以 及 re3data.org 的 图 标 


知识 库 。 科 研 人 员 在 re3data.org 中 可 以 清楚 看 到 每 个 
RDR 的 访问 与 使 用 条 件 以 及 其 他 特性 。 

该 网 站 (http:/www.re3data.org/faq) 解 释 了 图 标 和 
它们 的 含义 。 这 些 图 标 引 起 RDR 运行 机 构 在 
re3data.org 上 注册 的 意愿 。 不 过 , 符号 系统 不 只 是 对 
科研 人 员 有 用 ,而且 也 对 RDR 维护 者 有 用 ， BITE 
后 者 比较 知识 库 的 优 缺点 。 这 也 使 得 re3data.org 成 为 
一 项 随 着 RDRs 而 不 断 更 新 和 改版 的 实用 工具 


-vo 


图 2 描绘 科研 数据 权益 的 符号 系统 


简单 质朴 的 re3data.org 搜索 设计 ( 见 图 3) 会 让 每 
次 搜索 结果 包括 : RDR 的 名 称 、 知 识 库 覆 盖 的 主题 、 
一 些 描述 基础 设施 的 图 标 ( 见 图 4), 以 及 是 否 已 经 
re3data.org 审核 通过 等 信息 。 


reSdata.oro 


图 4 搜索 后 的 点 击 列表 
信息 过 滤 是 检索 结果 的 凝练 , 它 采 用 : 主题 、 内 
容 类 型 、 国 家 、 认 证 、 开 放 获取 、 了 永久 标识 符 以 及 审 
核 情况 等 次 级 选项 , 来 产生 搜索 分 页 。 通 过 点 击 知识 
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PEAR, 可 以 浏览 各 个 RDR 入 口 网 站 如 图 5 所 示 : 


re3data.rg 


图 5 科研 数据 知识 库 的 详细 描述 


RDR 维护 者 可 以 经 过 一 道 简单 的 申请 方式 ， 建 
1X. re3data.org 收录 他 们 的 数字 基础 设施 。 项 目 小 组 会 
列举 和 检查 在 目录 上 提交 的 知识 库 。 当 满 足 最 低 收录 
条 件 时 , 知识 库 就 被 索引 , 这 意味 着 它们 可 以 提供 数 
据 获取 以 及 在 网 页 上 有 明确 的 术语 解释 。 我 们 在 实践 
过 程 中 考虑 到 : 如 果 过 分 区 隔 RDR 网 站 的 结构 ,会 
耗费 索引 过 程 的 时 间 ; 而 且 目 前 仅 有 少数 RDR 具有 
服务 政策 、 指 定 社 群 和 使 用 条 款 , 还 有 某 些 RDR 要 
求 联系 维护 者 才能 拿 到 这 些 信息 。 鉴 于 这 类 情况 的 频 
繁 发 生 , 我 们 优化 了 re3data.org 工作 流程 ,并且 改善 
T RDR 维护 者 的 反馈 渠道 。 


4 展 8 


随 着 负责 数字 议程 (http://ec.europa.eu/digital- 
agenda) 的 欧盟 委员 Kroes 疾 呼 “我 们 要 开启 开放 科学 
的 时 代 ” 宣 言 ， 凸显 了 开放 性 (Openness) 就 是 数字 科 
学 的 范式 [站 。 这 要 求 发展 一 种 永久 性 的 信息 基础 设 
je, 好 让 科学 家 们 能 够 共享 他 们 的 科研 数据 ， 并 且 让 
下 一 代 科 研 人 员 能 够 继续 获取 与 重用 科研 数据 。 

所 有 re3data.org 项 目 合作 伙伴 资助 了 注册 机 制 
的 长 期 运行 。 基 于 利益 相关 者 的 反馈 ，re3data.org 将 
继续 发 展 科 研 数据 管理 的 新 功能 与 服务 。 对 此 安排 与 
DataCite 在 2012 年 春季 签署 了 合作 备忘录 。 作 为 科 
研 数据 的 永久 唯一 标示 符 倡 议 者 之 一 的 DataCite 是 
德国 科研 基金 会 资助 的 数据 出 版 项 目 成 果 , 也 是 
re3data.org 的 联盟 成 员 之 一 上 1。 在 这 种 合作 模式 下 ， 
两 个 团体 之 间 的 信息 交流 显得 极为 重要 。 目前 正在 探 
讨 像 是 Databib(http:/databib.org) 等 的 相关 协议 。 为 了 
促进 注册 机 制 的 技术 和 结构 化 发 展 , re3data.org AMIE 
的 项 目 伙 伴 将 继续 促进 RDR 更 紧密 的 集成 和 更 大 规 
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模 的 连贯 性 。 

尽管 re3data.org 尚 在 起 步 阶段 ， 截 至 2013 年 7 
月 已 有 400 个 RDR 编 和 re3data.org 的 索引 ， 超 过 288 
个 被 审核 通过 。 项 目下 一 阶段 的 工作 集中 在 改善 可 用 
性 和 实施 新 功能 。 超 越 登记 注册 的 发 展 ， 本 项 目 追 求 
科研 数据 知识 库 的 标准 和 网 络 。 本 项 目 努 力促 使 在 创 
作 共 用 许可 CC0( 许 可 授权 : 公共 知识 共享 ) 下 ， 所 有 
注册 的 元 数据 得 以 开放 使 用 。 与 此 同时 ，re3data.org 
为 开放 科学 开辟 了 一 条 实践 之 道 。 

( 注 : 原文 作者 致谢 开发 fe3data.org 期 间 参 与 项 目的 成 
Ji: Gabriele Kloska, Evelyn Reuter, Jessika Rücknagel, 


Markus Schnalke, Edeltraud Schnepf, Angelika Semrau, 
Shaked Spier. ) 
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Abstract: Researchers require infrastructures that ensure a maximum of accessibility, stability and reliability to 
facilitate working with and sharing of research data. Such infrastructures are being increasingly summarized under the 
term Research Data Repositories (RDR). The project re3data.org-Registry of Research Data Repositories-has begun to 
index research data repositories in 2012 and offers researchers, funding organizations, libraries and publishers an 
overview of the heterogeneous research data repository landscape. In July 2013 re3data.org lists 400 research data 
repositories and counting. 288 of these are described in detail using the re3data.org vocabulary. Information icons help 
researchers to easily identify an adequate repository for the storage and reuse of their data. This article describes the 
heterogeneous RDR landscape and presents a typology of institutional, disciplinary, multidisciplinary and 
project-specific RDR. Further the article outlines the features of re3data.org, and shows how this registry helps to 
identify appropriate repositories for storage and search of research data. 
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